Model Selection

Reinforcement Learning Reasoning

# Reinforcement Learning Reasoning

Acereason Nemotron 14B GGUF

A math and programming reasoning model trained with reinforcement learning, excelling in multiple benchmark tests

Large Language Model

Transformers English

Open Reasoner Zero 7B

Open Reasoner Zero is an open-source solution for large-scale reinforcement learning based on foundational models, focusing on scalability, simplicity, and ease of use for large-scale reasoning-oriented reinforcement learning.

Large Language Model

Open-Reasoner-Zero

Deepseek R1 Zero

DeepSeek-R1 is the first-generation reasoning model developed by DeepSeek, trained through reinforcement learning, excelling in mathematics, coding, and reasoning tasks.

Large Language Model

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase